[アップデート] Amazon BedrockにRerankモデルが追加されました #AWSreInvent
こんにちは、@TakaakiKakei です。
2024年12月2日~12月6日(米国太平洋標準時)に開催されるAWS re:Invent 2024に関連して、以下のアップデートについてご紹介します。
- Amazon BedrockがRerankモデルをサポート
Support for reranking models
3行まとめ
- Amazon Bedrock が新しいRerankモデルをサポート(Amazon Rerank 1.0 とCohere Rerank 3.5)
- セマンティック検索の課題を解決し、ユーザーの意図やコンテキストをより反映可能に
- RAGの精度向上や応答コストの削減が期待される
何が嬉しいか
セマンティック検索は、クエリと文書を意味的に関連付けることで、単語が一致しなくても関連性の高い情報を取得できる便利な技術です。しかし、ユーザーのクエリが複雑だったり曖昧だったりする場合、最適な文書を優先的に選ぶのが難しく、部分的にしか関連性のない情報が返されることがあります。また、情報源の正確な引用や帰属が難しくなり、信頼性や透明性が損なわれるという課題もあります。
Rerankモデルは、こうした課題を解決するために、取得した文書の中からユーザーの意図や文脈に最も適した情報を優先的に選び出します。これにより、生成モデルが受け取る情報の質が向上し、応答の正確性や信頼性を高めることが期待できます。
調査
モデルの有効化方法
東京リージョンのAmazon Bedrockのサービス画面を開き、モデルアクセスページに移動すると、Rerankモデルが追加されていることが確認できます。
「モデルアクセスを変更」をクリックして、Rerankモデルを選択して有効化します。
モデルアクセスページで、対象モデルのアクセスステータスが「アクセスが付与されました」に変更されていることを確認します。
プレイグラウンドでの利用可能性
冒頭のAWSブログではナレッジベースのテストについて言及されていますが、現時点ではプレイグラウンドでの利用はまだ不可能なようです。おそらく近い将来、モデル選択オプションに追加されるでしょう。
新しいIAMポリシー
冒頭のブログには以下のIAMポリシーが記載されています。既存のナレッジベースでRerankモデルを利用する場合は、以下のようなポリシーの追加が必要かもしれません。
{
"Version": "2012-10-17",
"Statement": [
{
"Sid": "Statement1",
"Effect": "Allow",
"Action": [
"bedrock:InvokeModel"
],
"Resource": [
"arn:aws:bedrock:us-west-2::foundation-model/amazon.rerank-v1:0"
]
},
{
"Sid": "Statement2",
"Effect": "Allow",
"Action": [
"bedrock:Rerank"
],
"Resource": [
"*"
]
}
]
}
関連のユーザーガイドも公開されているので、適宜ご確認ください。
モデルの概要
AWSマネジメントコンソールへのログインが必要ですが、以下のページが情報をよくまとめています。
- Model ID: amazon.rerank-v1:0
- Model ARN: arn:aws:bedrock:ap-northeast-1::foundation-model/amazon.rerank-v1:0
- Model ID: cohere.rerank-v3-5:0
- Model ARN: arn:aws:bedrock:ap-northeast-1::foundation-model/cohere.rerank-v3-5:0
下記のドキュメントには、現在利用可能なリージョンとAPIが記載されています。
現在、利用可能なリージョンは以下の通りです。
- US West (Oregon)
- Canada (Central)
- Europe (Frankfurt)
- Asia Pacific (Tokyo)
また、以下のAPIで呼び出しが可能です。
- InvokeModel
- Rerank
- Retrieve
- RetrieveAndGenerate
あわせて読みたい
他にも関連する公式ドキュメントがありますので、ご参考ください。
- Rerankの公式ユーザーガイド
- RerankのAWS CLI Command
執筆時点では「Page not found」ですが、上記ユーザーガイドにリンクされているので、おそらく近々こちらに追加されるでしょう。
- Cohere Rerank 3.5 の概要と利用方法に関するブログ
さいごに
Rerankモデルの利用により、RAGアプリケーションでユーザーの意図やコンテキストをより適切に反映できるようになることが期待されます。プレイグラウンドやAPIのドキュメントが整備され次第、さらにに検証を行いたいと思います。
それではまた!